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摘要 : 为 了 解 杜 仲 基因 密码 子 使 用 模式 ， 以 杜仲 基因 组 密码 子 为 研究 对 象 , 运用 CodonW 软 
件 对 杜仲 的 320 个 蛋白 编码 基因 进行 同 义 密 码 子 相对 使 用 频率 (RSCU) 分 析 、ENC-GC3s 
关联 分 析 编 码 基 因 的 密码 子 ENC 值 、PR2-plot 偏 倚 分 析 编 码 基因 的 密码 子 碱 基 使 用 频率 。 

运用 CUSP 软件 与 Codon Usage Database 软件 对 杜仲 基因 密码 子 的 GC 含量 、 使 用 频率 与 代 
表 性 物种 烟草 、 拟 南 芥 、 大 肠 杆 菌 和 酿酒 酵母 的 密码 子 GC 含量 和 使 用 频率 进行 比较 。 结 果 
表明 : 杜仲 基因 密码 子 的 RSCU>1 的 密码 子 有 30 个 ， 其 中 18 个 以 G/C 结尾 、12 个 以 A/U 
结尾 ; 说 明 杜 仲 基因 密码 子 偏好 以 G/C 结尾 ， 且 偏好 性 较 强 。 有 效 密码 子 数 “ENC) 范 围 为 
30 一 60， 该 范围 内 的 密码 子 距 离 标准 曲线 较 近 其 ENC 值 小 ， 偏 好 性 较 强 。PR2-plot 偏 倚 分 
析 碱 基 使 用 频率 显示 G>C、U>A。 杜仲 与 代表 性 物种 的 GC 含量 分 析 显 示 杜 仲 的 GCj>、GCs3 
以 及 平均 GC 含量 均 高 于 代表 性 物种 ; 杜仲 与 代表 性 物种 的 密码 子 使 用 频率 分 析 表 明 杜 仲 与 
烟草 、 酿 酒 酵母 的 密码 子 偏 好 较为 接近 ， 杜 仲 与 拟 南 芥 、 大 肠 杆 菌 的 密码 子 偏好 差距 较 大 。 
杜仲 是 我 国 特有 的 珍贵 中 药材 对 其 进行 密码 子 使 用 模式 分 析 , 研究 其 密码 子 偏好 规律 , 为 杜 
' 植 物 基因 工程 中 外 源 基因 的 改良 及 表达 提供 理论 基础 。 
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Abstract: To comprehend the codon usage pattern of genes in Eucommia ulmoides, taking the 


Eucommia ulmoides genome codons as the research object, the 320 coding DNA sequences was 
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analyzed to obtain to the results of relative synonymous codon usage(RSCU), ENC-GC3s analysis 
of codon ENC values of coding genes and PR2-plot bias analysis of the codon base usage 
frequency of the coding gene. By using CUSP and Codon Usage Database software to compare 
the GC contents and codon occurrence frequency of Eucommia ulmoides with Arabidopsis 
thaliana, Nicotiana tabacum, Escherichia coli and Saccharomyces cerevisiae. The results showed 
that the number of RSCU value was great than 1 has 30 codons, including the ending of 18 genes 
were G/C and 12 genes A/U. These suggested that the codons preferred ends with G/C, and had a 
strong bias. The number of effective codons (ENC) ranges from 30 to 60. The codons within this 
range were closer to the standard curve and their ENC values were smaller and had a higher 
preference. PR2-plot analysis showed that G>C,U>A, in the base usage frequency. Analysis of GC 
contents of Eucommia ulmoides and representative species showed that the Eucommia ulmoides 
GC1, GC3 and average GC contents were higher than those of representative species. The analysis 
of the codon usage frequency of Eucommia ulmoides and representative species showed that the 
codon preferences of Eucommia ulmoides and Nicotiana tabacum and Saccharomyces cerevisiae 
were close.The codon preferences of Eucommia ulmoides and Arabidopsis thaliana and 
Escherichia coli were quite different. Eucommia ulmoides is a precious Chinese medicinal 
material unique to our country. It analyzes the codon usage pattern and studies its codon 
preference and provides a theoretical basis for the improvement and expression of foreign genes in 
Eucommia ulmoides plant genetic engineering. 
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蛋白 质 的 基本 组 成 单位 是 氨基 酸 ， 氨 基 酸 由 三 联 体 密码 子 组 成 。 生 物体 内 含有 20 种 氨 
基 酸 由 61 个 密码 子 编码 ， 剩 余 3 个 为 终止 密码 子 〈 李 泾 等 ，2016) 。 编 码 氨基 酸 的 三 联 体 
密码 子 中 前 两 位 碱 基 基 本 决定 氨基 酸 的 种 类 , 第 三 位 碱 基 的 改变 对 氨基 酸 影 响 较 小 。 即 在 编 
码 氨基 酸 过 程 中 即便 密码 子 第 三 位 碱 基 由 于 基因 突变 或 其 他 原因 造成 改变 , 也 不 影响 氨基 酸 
的 正常 编码 〈 赵 春 丽 等 ，2019) 。 编 码 同 一 氨基 酸 的 不 同 密码 子 称 同 义 密码 子 ， 该 现象 称 为 
密码 子 简 并 性 〈 苏 慧 等 ，201$) 。 密 码 子 简 并 性 具有 重要 生物 学 意义 ， 可 以 减少 有 害 突变 ; 
也 可 使 DNA 上 碱 基 组 成 有 较 大 变动 余地 , 因此 密码 子 简 并 性 在 物种 的 稳定 上 起 一 定 作 用 ( 张 
文 娟 ，2006) 。 理 论 上 在 不 存在 外 界 压 力 或 者 其 他 干扰 因素 条 件 下 ， 同 义 密码 子 的 使 用 频率 
是 相同 的 。 但 实际 在 编码 氨基 酸 时 同 义 密 码 子 的 使 用 频率 具有 差异 , 这 种 现象 称 为 密码 子 偏 
好 性 《〈 胡 桂 兵 等 ，2006) 。 密 码 子 偏好 性 在 异 源 表达 方面 具有 重要 作用 ， 不 仅 可 以 用 来 描述 
基因 进化 规律 、 基 因 表达 过 程 中 的 调控 机 制 ,也 可 用 于 预测 外 源 基 因 的 最 适 窒 主 ,通过 密码 
子 优 化 提高 宿主 中 外 源 基 因 的 表达 量 以 及 评估 基因 的 表达 水 平等 (Wang et al., 2013; 胡 振 民 
等 ， 2019) 。 生 物 在 长 时 间 的 进化 过 程 中 由 于 基因 突变 和 外 界 环境 的 影响 会 形成 自身 偏好 的 
密码 子 系统 ， 当 某 一 密码 子 在 编码 氨基 酸 受 阻碍 时 , 与 其 编码 相同 氨基 酸 的 同 义 密码 子 能 够 
代替 其 行使 功能 从 而 保证 蛋白质 合 成 的 准确 性 (Sophiarani et al., 2019) 。 分 析 生 物 对 同 义 密 
码 子 的 使 用 情况 可 为 该 生物 的 外 源 基 因 插 入 及 表达 提供 一 定 的 理论 依据 ( 雷 慧 等 ，2019)。 

杜仲 (Eucommia ulmoides) 为 杜仲 科 (Eucommiaceae) 植物 ， 是 我 国 特 有 树种 ， 经 
济 价值 很 高 、 资 源 稀少 〈Liu et al., 2005) 。 随 着 基因 工程 技术 的 鞍 勃 发 展 关 于 杜仲 的 研究 
范围 越 来 越 广 。 近 年 来 对 杜仲 的 研究 有 杜仲 几 丁 质 酶 基因 在 作物 真菌 病害 方面 的 抗 性 机 制 研 
究 ( 郭 林 霞 等 ，2016; 丁 延庆 ，2017) 、 杜 仲 dirigent 基因 的 功能 分 析 〈 王 维 东 等 ，2018) 
以 及 杜仲 胶合 成 相关 基因 的 克隆 及 分 析 〈 王 宇 等 ，2015) 研究 等 方面 。 近 些 年 在 杜仲 遗传 转 
化 方面 的 研究 越 来 越 多 , 但 杜仲 为 木 本 植物 生长 周期 长 、 遗 传 转化 不 易 进行 等 原因 ， 因 此 探 
究 杜 仲 基 因 的 密码 子 使 用 模式 可 为 杜仲 的 遗传 转化 提供 更 多 可 能 性 ,该 研究 在 实验 室 前 期 的 
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究 基 础 上 对 杜仲 的 320 个 蛋白 编码 基因 进行 同 义 密码 子 相 对 使 用 频率 、ENC 与 GC;; 关联 
分 析 及 PR2-plot 偏 倚 分 析 ， 并 将 杜仲 与 代表 性 物种 大 肠 杆菌 、 拟 南 价 、 酿 酒 酵母 和 烟草 的 
密码 子 GC 含量 及 密码 子 使 用 频率 进行 比较 ， 分 析 杜 仲 与 他 们 对 于 同 义 密码 子 的 使 用 模式 。 
该 研究 为 杜仲 基因 寻找 合适 的 表达 系统 提供 理论 依据 , 亦 可 为 外 源 基因 在 杜仲 中 的 异 源 表达 
提供 理论 基础 。 


1 材料 与 方法 


1.1 实验 材料 


以 杜仲 基因 组 测序 所 得 序列 为 研究 对 象 , 杜 仲 基因 组 序列 为 实验 室 前 期 基础 通过 试剂 盒 
法 提取 杜仲 总 RNA， 经 反 转 录 得 cDNA， 测 序 获得 320 个 蛋白 编码 基因 。 大 上 肠 杆菌 、 拟 南 
芥 、 烟 草 、 酿 酒 酵母 的 密码 子 使 用 频率 数据 来 源 于 Codon Usage Database 软件 。 


C 1.2 实验 方法 
SG 1.2.1 同 义 密码 子 相 对 使 用 频率 分 析 

同 义 密码 子 相 对 使 用 频率 (relative synonymous codon usage，RSCU ) 指 在 编码 氨基 酸 
时 指定 密码 子 与 所 有 能 编码 该 氨基 酸 的 密码 子 的 比值 。RSCU 值 表明 密码 子 使 用 偏离 随机 选 
择 的 程度 , 反映 同 义 密码 子 非 均 衡 使 用 的 偏好 程度 。 RSCU<1 说 明 编 码 氨基 酸 时 使 用 较 多 随 
机 密码 子 ， 偏 好 性 较 弱 : RSCU=1， 表 明 编 码 氨 基 酸 的 指定 密码 子 数 等 于 所 有 能 编码 该 氨基 
酸 的 密码 子 数 ， 即 该 密码 子 不 具 偏 好 性 ; 若 RSCU>1 说 明 编码 氨基 酸 时 使 用 较 多 的 指定 密码 
子 ， 其 偏好 性 较 强 。 该 分 析 用 CodonW (http://bioweb.pasteur. Fr/seqanal/interfaces/codonw.htm 
DD) 软件 分 析 基 因 序 列 的 同 义 密码 子 相对 使 用 次 数 和 频率 ， 来 评估 密码 子 的 偏好 性 (Subrama- 
nian, 2008) 。 
1.2.2 ENC-GCs, 关联 分 析 

有 效 密码 子 数 (effective number of codons, ENC) 指 在 编码 氨基 酸 时 所 用 的 全 部 密码 子 
的 种 类 个 数 ， 其 最 小 值 为 20， 最 大 值 为 61。ENC 值 越 接 近 20 说 明 密 码 子 偏好 性 越 强 ， 越 
靠近 61 则 偏好 性 越 弱 。 以 ENC 值 为 纵 坐 标 ，GC; 值 为 横 坐 标 作 图 分 析 。 图 中 标准 曲线 代表 
pT 无 选择 压力 时 ， 密 码 子 偏好 性 完全 由 突变 所 决定 Pamela et al., 2007) 。 散 点 分 布 于 曲线 周 
围 ， 散 点 与 标准 曲线 的 距离 表明 密码 子 的 偏好 性 强 弱 。 距 离 远 表示 ENC 值 小 密码 子 偏好 性 
强 ; 有 反之 则 ENC 值 大 密码 子 偏好 性 弱 。 
1.2.3 PR2-plot 偏 倚 分 析 
通常 在 无 选择 压力 情况 下 ， 密 码 子 A/U、G/C 舍 量 分 布 均匀 〈 张 雅 丽 等 ， 2002) 。 但 因 
外 界 压力 、 环 境 等 因素 的 影响 它们 的 含量 分 布 不 均 ，PR2-plot 图 被 分 为 4 个 区 域 ， 在 平面 图 
的 上 方 表示 碱 基 A 的 使 用 频率 多 于 碱 基 U， 反 之 U 多 于 A; 在 平面 图 的 左 方 表示 碱 基 C 的 
使 用 频率 高 于 碱 基 G， 反 之 G 多 于 C。 
1.2.4 杜仲 与 代表 性 物种 的 GC 含量 及 密码 子 使 用 频率 比较 

利用 分 析 软 件 CUSP 计算 杜仲 基因 中 各 密码 子 的 出 现 频率 ， 并 与 从 Codon Usage 
Database 软件 中 获得 的 烟草 、 拟 南 芥 、 大 肠 杆菌 、 酿 酒 酵母 的 密码 子 使 用 频率 进行 比较 ， 比 
值 >2 或 <0.5 表示 两 物种 间 密 码 子 使 用 俩 好 性 差异 较 大 《〈 晃 岳 恩 等 ，2012) 。 


2 结果 与 分 析 


2.1 RSCU 值 分 析 


通常 以 RSCU 值 来 分 析 密 码 子 偏 好 性 ， 该 研究 运用 CodonW 软件 分 析 杜 仲 基因 密码 子 
的 RSCU 值 ，RSCU 值 指 编码 氨基 酸 时 指定 密码 子 与 所 有 能 编码 该 氨基 酸 的 密码 子 的 比值 。 
分 析 杜 仲 基因 密码 子 的 RSCU 值 结果 得 ，RSCU>1 的 密码 子 有 30 个， 其 中 以 UGA、CUC、 
AGG 偏好 性 最 强 ，RSCU 值 分 别 为 1.61、1.51 和 1.46。RSCU>1 的 密码 子 有 18 个 以 G/C 结 
尾 ，12 个 以 A/U 结尾 ， 说 明 杜 仲 基因 密码 子 偏 爱 以 G/C 结尾 。RSCU=1 的 密码 子 有 4 个 ， 
RSCU<1 的 密码 子 有 29 个 ， 其 中 包括 2 个 终止 密码 子 ， 从 RSCU 值 分 析 得 出 杜仲 基因 在 编 
码 氨 基 酸 时 对 同 义 密码 子 的 使 用 偏好 性 较 强 。 


表 1 杜仲 基因 编码 氨基 酸 的 同 义 密码 子 相对 使 用 度 


Table 1 Relative usage of synonymous codons encoding amino acids in Eucommia ulmoides 


氨基 酸 密码 子 个 数 相对 使 氨基 酸 密码 子 个 数 相对 使 
(em | Amino acid Codon Count 用 上 度 Amino Acid Codon Count 上 度 (RSCU ) 
| (RSCU) 

UUU 857 0.90 UAU 308 1.01 
茜 丙 氮 Phe 栈 氨 酸 Tyr 
UUC 1 057 1.10 UAC 299 0.99 
UUA 279 0.38 UAA 67 0.63 
UUG 968 1.32 终止 密码 TER UAG 81 0.76 
Re CUU 948 1.29 UGA 172 1.61 
亮 氨 酸 Leu 
CUC 1 108 1.51 于 本 本 CAU 610 0.93 
组 氨 酸 His 
CUA 312 0.43 CAC 695 1.07 
CUG 789 1.07 2 CAA 620 1.04 
= 谷 氨 酰 胺 GIn 
AUU 687 1.00* CAG 570 0.96 
异 亮 氨 Tle AUC 905 1.32 AAU 657 0.98 
天 冬 酰胺 Asn 
AUA 470 0.68 AAC 684 1.02 
甲 硫 氨 Met AUG 1216 1.00* AAA 728 0.93 
赖 氨 酸 Lys 
GUU 693 1.10 AAG 835 1.07 
ee GUC 601 0.96 i GAU 734 1.21 
屿 氨 酸 Val 天 冬 氨 酸 Asp 
GUA 455 0.72 GAC 479 0.79 
GUG 763 1.21 Po GAA 760 0.92 
谷 氨 酸 Glu 
UCU 824 1.11 GAG 900 1.08 
UCC 1 035 1.39 UGU 400 0.91 
半 胱 氨 酸 Cys 
I UCA 693 0.93 UGC 482 1.09 
丝氨酸 Ser i 
UCG 730 0.98 色 氨 酸 Trp UGG 703 1.00* 
AGU 434 0.58 CGU 288 0.54 
AGC 756 1.01 精 氨 酸 Arg CGC 428 0.80 
有 铺 氨 酸 Pro CCU 613 0.86 CGA 439 0.82 
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CCC 638 0.89 CGG 580 1.09 
CCA 811 1.13 AGA 687 1.29 
CCG 805 1.12 AGG 776 1.46 
ACU 498 0.85 GGU 588 0.95 
ee ACC 701 1.19 GGC 616 1.00* 
苏 氨 酸 Thr 甘氨酸 Gly 
ACA 603 1.03 GGA 663 1.07 
ACG 548 0.93 GGG 603 0.98 
GCU 692 1.03 
GCC 800 1.20 
丙 氨 酸 Ala 
GCA 621 0.93 
GCG 564 0.84 
注 : 表 中 有 下 划 线 的 为 RSCU>1 的 值 ， 标 * 的 为 RSCU=1 的 值 。 


Note: The underlined values in the table are RSCU>1, * is the value of RSCU=1. 


2.2 ENC 与 GC3。 关 联 分 析 


以 杜仲 基因 密码 子 ENC 值 为 纵 坐 标 ，GC; 值 为 横 坐 标 作 图 分 析 ， 如 图 1。ENC 值 表示 
密码 子 的 偏好 性 强 弱 ，ENC 值 越 接 近 20 说 明 密 码 子 偏好 性 越 强 ;，ENC 值 越 接 近 61 说 明 密 
码 子 偏好 性 越 弱 。 分 析 得 杜仲 基因 ENC 值 多 集中 分 布 于 30 一 60 之 间 ; 该 区 域内 的 密码 子 距 
离 标准 曲线 的 距离 远近 不 一 , 但 大 部 分 密码 子 距离 标准 曲线 较 近 其 ENC 值 小 , 偏好 性 较 强 。 


20.00 


025 050 075 1.00 
GC3s 


横 坐 标 为 GC3 值 ， 纵 坐标 为 ENC 值 。 
The abscissa is the GC3 value and the ordinate is the ENC value. 
1 ENC-plot 分 析 
Fig.1 ENC-plot analysis 
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2.3 PR2-plot 偏 倚 分 析 


对 杜仲 基因 密码 子 进行 PR2-plot 侦 倚 分 析 ， 如 图 2 所 示 。 图 2 中 密码 子 多 分 布 于 平面 
图 的 下 方 和 平面 图 的 右 方 ， 说 明 碱 基 使 用 频率 G>C、U>A。 帮 密码 子 偏 好 性 完全 受 突变 的 
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影响 ， 则 碱 基 A、U、C、G 的 使 用 频率 相当 ， 因 此 说 明 杜 仲 基因 密码 子 受到 突变 和 选择 的 
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横 坐 标 为 Gy(G3+C3)， 纵 坐标 为 Ay(As+T3)。 

The abscissa is Gs/(G3+C3) and the ordinate is AX/(A3+T3). 

图 2 PR2-plot 偏 倚 图 分 析 
Fig. 2 Analysis of PR2 bias plot 


2.4 杜仲 与 代表 性 物种 的 GC 含量 及 密码 子 使 用 频率 比较 


100 


将 杜仲 与 4 种 代表 性 物种 的 GC 含量 进行 比较 ， 如 表 2 所 示 。 杜 仲 基因 密码 子 的 平均 
GC 含量 最 高 为 51.7%， 密 码 子 第 三 位 碱 基 GC 含量 也 最 高 为 33.61%， 说 明 杜仲 基因 密码 子 
偏好 GC 结尾 。 其 次 为 大 肠 杆菌 、 拟 南 芥 、 烟 草 和 酿酒 酵母 。 杜 仲 与 代表 性 物种 的 密码 子 使 


用 频率 以 及 频率 比值 结果 如 表 3 所 示 ， 杜 仲 与 代表 性 物种 的 密码 子 使 用 


频率 比值 >2 或 <0.5 


的 分 别 有 31 个 、34 个 、34 个 、32 个 ， 该 值 说 明 两 物种 间 对 该 密码 子 的 使 用 偏差 ， 表 3 中 


杜仲 与 大 肠 杆 菌 和 拟 南 芥 的 密码 子 使 用 偏好 具有 明显 差异 ,而 杜仲 与 烟草 、 酿 酒 酵母 的 密码 


适 。 


表 2 杜仲 与 代表 性 物种 GC 的 含量 


子 偏好 性 差别 较 小 。 若 要 为 杜仲 基因 寻找 宿主 表达 系统 的 话 , 可 选择 烟草 或 酿酒 酵母 较为 合 


Table 2 Contents of GC in Eucommia ulmoides and representative Species 


杜仲 拟 南 芥 烟草 


大 肠 杆 芯 


Eucommia Arabidopsis Nicotiana 


酿酒 酵母 


Saccharomyces 


Escherichia coli 


ulmoides thaliana tabacum 


cerevisiae 


GC 50.85% 45.69% 45.3% 47.22% 40.61% 
GC, 53.61% 42.38% 39.53% 47.45% 38.1% 
平均 含量 
Average 51.70% 44.59% 43.38% 47.3% 39.77% 
content 
表 3 杜仲 与 代表 性 物种 的 密码 子 使 用 频率 比较 


Table 3 Comparison of codon frequency between Eucommia ulmoides and representative species 


频率 比值 
氨基 酸 密码 子 ee Comparison of codon preference 
Frequency of codon usage (%) 
Amino acid Codon 
Eu Nt At Eco Sc Eu/Nt Eu/At Eu/Eco Eu/Sc 
茶 丙 氨 酸 Phe UUU 9.9 25.1 21.8 244 26.1 0.39 0.45 0.4 0.37 
UUC 20.9 18.0 207 13.9 184 1.16 1.00 1.50 1.13 
亮 氨 酸 Leu UUA 3.8 13.4 127 174 262 028 0.29 0.21 0.14 
UUG 33.6 223 209 129 272 1.50 1.60 2.60 1.23 
CUU 49 240 241 145 123 020 0.20 0.33 0.39 
CUC 4.9 12.3 16.1 9.5 5.4 039 0.30 0.51 0.90 
CUA 2.2 94 99 5.6 134 0.23 0.22 0.39 0.16 
CUG 13.2 102 9%8 374 10.5 1.29 1.34 0.35 1.28 
异 亮 氨 酸 Te AUU 10.4 27.8 21.5 29.6 30.1 0.37 0.48 0.35 0.34 
AUC 11 13.9 18.5 194 172 0.79 0.59 0.56 0.63 
AUA 3.8 140 126 13.3 178 027 0.30 0.28 0.21 
甲 硫 氨 酸 Met AUG 385 25.0 245 237 209 1.54 1.57 1.62 1.84 
纺 氢 酸 Val GUU 60 26.8 272 216 221 022 0.22 0.27 0.27 
GUC 4.4 11.1 128 13.1 11.8 039 0.34 0.33 0.37 
GUA 2.7 11.4 99 13.1 11.8 0.23 0.27 0.20 0.22 
GUG 18.1 167 174 19.9 108 1.08 1.04 0.90 1.67 
丝氨酸 Ser UCU 25.8 200 252 13.1 23.5 1.29 1.02 1.96 1.09 
UCC 297 102 112 97 142 2.91 2.65 3.06 2.09 
UCA 44 17.6 18.3 13.1 187 2.5 2.40 3.35 2.35 
UCG 53.4 53 93 82 86 1007 5.74 6.51 6.20 
AGU 7.7 13.3 14 132 142 0.57 0.55 0.58 0.54 
AGC 13.7 10.0 11.3 143 9.8 1.37 1.21 0.95 1.39 
且 氨 酸 Pro CCU 11.5 18.7 18.7 9.5 135 0.61 0.61 1.21 0.85 
CCC 192 66 53 62 68 290 3.62 3.09 2.82 
CCA 36.9 198 161 91 183 1.86 2.29 4.05 2.01 
CCG 622 50 86 145 53 1244 7.23 4.28 11.73 
苏 氨 酸 Thr ACU 12.6 203 17.5 13.1 203 0.62 0.72 0.96 0.62 
ACC 25.3 97 103 189 127 2.60 2.45 1.33 1.99 


ACA 22 17.4 15.7 15.1 17.8 1.26 1.40 1.45 1.23 

ACG 303 45 77 136 8 6.73 3.93 2.22 3.78 

丙 氨 酸 Ala GCU 11 31.2 28.3 18.9 212 0.35 0.38 0.58 0.51 
GCC 209 125 103 216 126 1.67 2.02 0.96 1.65 

GCA 19.8 23.1 175 23 16.2 0.85 1.13 0.86 1.22 

GCG 45.7 5.8 9 211 62 7.87 5.07 2.16 7.37 

酷 氨 酸 Tyr UAU 3.8 17.8 14.6 21.6 18.8 0.21 0.26 0.17 0.20 
UAC 8.2 13.5 13.7 11.7 14.8 0.60 C0.59 0.70 0.55 

组 氨 酸 His CAU 6.0 13.4 13.8 124 13.6 0.44 0.43 0.48 0.44 
CAC 6.0 8.7 87 73 7.8 0.68 0.68 0.82 0.76 

谷 氨 酰胺 GIn CAA 6.0 20.7 19.4 144 27.3 0.28 0.30 0.41 0.21 
CAG 12.6 15.0 15.2 267 12.1 0.84 0.82 0.47 1.04 

天 冬 酰胺 Asn AAU 7.1 280 223 293 35.7 0.25 0.31 0.24 0.19 
AAC 12.6 17.9 209 203 248 0.70 0.60 0.62 0.50 

赖 氨 酸 Lys AAA 11 32.6 30.8 372 41.9 0.33 0.35 0.29 0.26 
AAG 21.4 33.5 327 15.3 30.8 0.63 € 0.65 1.39 0.69 

天 冬 氨 酸 Asp GAU 6.6 36.9 36.6 337 37.6 0.17 0.18 0.19 0.17 
GAC 6.0 169 17.2 17.9 202 0.35 0.34 0.33 0.29 

谷 氨 酸 Glu GAA 11.5 36 343 35.1 45.6 0.31 0.33 0.32 0.25 
GAG 22 29.4 322 194 192 0.74 0.68 1.13 1.14 

半 胱 氨 酸 Cys UGU 10.4 9.8 105 5.9 8.1 1.06 0.99 1.76 1.28 
UGC 66 7.2 72 5.5 48 0.91 0.91 1.2 1.37 

色 氨 酸 Trp UGG 24.2 122 125 13.4 10.4 1.98 1.93 1.80 232 
精 氨 酸 Arg CGU 4.4 7.5 9 159 64 0.58 0.48 0.27 0.68 
CGC 3.3 3.9 38 14 26 0.84 0.86 0.23 1.26 

CGA 9.9 53 63 4.8 3 1.86 1.57 2.06 3.3 

CGG 11.0 37 49 79 17 297 224 1.39 6.47 

AGA 17.6 122 19 71 213 144 0.92 2.47 0.82 

AGG 38 7.5 11 4 9.2 5.06 3.45 9.50 4.13 

甘氨酸 Gly GGU 3.8 223 222 237 239 0.17 0.17 0.16 0.15 
GGC 7.1 11.2 92 123 9%8 0.63 0.77 0.57 0.72 

GGA 11 23.2 242 13.6 109 047 0.45 0.80 1.00 

GGG 203 105 102 206 6 1.93 1.99 0.98 3.38 

注 : 表 中 Eu、Nt、At、Eco、Sc 分 别 代表 杜仲 、 烟 草 、 拟 南 芥 、 大 肠 杆菌 和 酿酒 酵母 ， 表 中 有 横 线 的 为 两 


物种 间 密 码 子 使 


频率 大 于 等 了 


F 2 或 小 于 等 于 0.5 的 值 。 


Note: Eu, Nt At， Eco and Sc in the table respectively represent Eucommia ulmoides, Nicotiana tabacu 


m, Arabidopsis thaliana, Escherichia coli, Saccharomyces cerevisiae; The vaules with horizontal lines in 


the table are the values with codon occurrence frequency greater than or equal to 2 or less than or equ 


al to 0.5 between the two species. 


联 体 密码 子 编码 , 密码 子 简 并 性 可 使 碱 基 第 三 位 改变 的 情况 下 编码 正确 的 所 
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基 酸 ,保证 蛋白 质 合成 的 准确 ,不 同 生物 的 密码 子 使 用 偏好 存在 差异 ， 即 便 同 一 生物 不 同 基 
因 的 密码 子 使 用 偏好 也 存在 差异 ( 吴 宪 明 等 ，2007〉。 密 码 子 使 用 偏好 是 生物 在 进化 过 程 中 
突变 、 选 择 的 综合 结果 , 研究 表明 密码 子 偏好 与 基因 表达 水 平 相关 ， 高 表达 基因 倾向 使 用 最 
优 密码 子 〈 赵 洋 等 ，2011) 。 密 码 子 偏 好 性 也 反应 了 生物 间 进 化 的 关系 ， 可 作为 生物 进化 关 
系 的 参考 ( 陈 哲 等 ， 2017) 。 密 码 子 使 用 模式 分 析 可 为 生物 的 外 源 基 因 插 入 及 表达 提供 一 定 
的 理论 依据 ( 罗 洪 等 ， 2015〉， 。 杜 仲 是 我 国 特有 的 珍贵 药材 ， 具 有 降 血压 、 安 胎 等 功效 。 但 
因 其 为 木 本 植物 、 生 长 周期 长 等 原因 , 杜仲 遗传 转化 不 易 进 行 且 转基因 杜仲 移 栽 至 土 里 存活 
率 不 高 。 因 此 探究 杜仲 基因 的 密码 子 使 用 模式 可 为 杜仲 的 遗传 转化 提供 更 多 可 能 性 。 

该 研究 以 杜仲 基因 组 为 对 象 , 分 析 杜 仲 基 因 密 码 子 使 用 模式 。 结 果 表 明 杜 仲 基因 密码 子 
RSCU>1 的 有 30 个 ， 其 中 18 个 密码 子 以 G/C 结尾 、12 个 密码 子 以 A/U 结尾 ;说 明 杜 仲 基 
因 密 码 子 偏好 以 G/C 结尾 ， 这 种 偏好 可 能 是 由 于 以 G/C 结尾 的 密码 子 具 有 较 高 的 结合 能 ， 
有 利于 保证 翻译 的 准确 性 〈 蒋 玮 等 ，2014)。ENC 值 大 小 可 量化 一 个 基因 的 密码 子 使 用 频率 
与 同 义 密码 子平 均 使 用 频率 的 偏差 , 从 而 检测 单个 基因 密码 子 的 偏好 程度 ( 朱 婷 婷 等 ,2017 ) 。 
ENC 值 与 期 望 ENC 值 差 异 越 小 ， 说 明 突 变 对 密码 子 偏 好 性 影响 越 大 ; ENC 值 与 期 望 ENC 
值 差 异 越 大 ， 说 明 选 择 对 密码 子 偏好 性 影响 越 大 ( 杨 国 锋 等 ，2015) 。 分 析 杜 仲 基因 密码 子 
ENC 值 ， 其 值 集中 分 布 于 30-60 间 ， 且 该 区 域内 的 密码 子 距 离 标准 曲线 较 近 ， 偏 好 性 较 强 。 
PR2-plot 分 析 中 , 平面 图 显示 各 基因 的 碱 基 组 成 , 其 中 点 代表 无 偏 倚 性 使 用 时 的 密码 子 状态 
即 A=U，G=C 〈 尚 明 照 等 ，2011; 邢 朝 斌 等 ，2013) 。 杜 人 基因 密码 子 的 PR2_plot 分 析 显 
示 碱 基 使 用 频率 G>C、U>A。 说 明 杜 仲 基因 密码 子 的 使 用 偏好 受到 自然 选择 和 基因 突变 的 
影响 。 杜 仲 与 拟 南 芥 、 烟 草 、 大 肠 杆 菌 、 酿 酒 酵母 等 代表 性 物种 的 密码 子 使 用 频率 都 具有 不 
同 程度 的 差异 ， 若 这 些 生 物 的 基因 要 在 杜仲 中 表达 ， 则 应 先进 行 密码 子 优化 。 杜 仲 与 烟草 、 
酿酒 酵母 的 密码 子 偏好 性 差别 较 小 ， 与 大 肠 杆菌 、 拟 南 芥 的 密码 子 偏好 性 差别 较 大 。 如 果 烟 
ee 4 需 优 化 个 别 密码 子 , 知 要 为 杜仲 基因 寻找 宿主 系统 
则 烟草 、 酿 酒 酵母 较为 合 

随 着 基因 工程 的 / 、 外 源 基因 的 功能 验证 多 采用 转基因 异 源 表达 。 外 源 基因 导入 
rd edn 5 答 主 系统 的 密码 子 使 用 偏好 不 同 ,， 导致 表 达 效 率 低下 。 密码 子 偏 

好 性 分 析 在 基因 异 源 表 达 方 面具 有 重要 意义 , 基于 同 义 密码 子 的 使 用 频率 不 同 为 了 提高 外 源 
基因 的 表达 水 平 可 对 稀有 密码 子 进行 改造 , 增加 优势 密码 子 使 用 频率 使 得 外 源 基因 更 好 的 表 
达 ( 胡 晓 艳 等 ，2019)。 该 研究 分 析 珍 贵 中 药材 杜仲 的 基因 密码 子 使 用 模式 ， 对 于 杜仲 中 外 源 
基因 的 插入 及 高 效 表 达 具 有 意义 并 提供 了 理论 基础 。 
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